فرمول پراکندگی متغیرهای برون زا. محاسبه واریانس گروه، بین گروهی و کل (طبق قانون جمع واریانس)

طبق بررسی نمونه، سپرده گذاران بر اساس اندازه سپرده در Sberbank شهر گروه بندی شدند:

تعریف کردن:

1) دامنه تغییرات؛

2) میانگین مبلغ سپرده؛

3) انحراف خطی متوسط.

4) پراکندگی؛

5) متوسط انحراف معیار;

6) ضریب تغییرات مشارکت.

راه حل:

این سری توزیع شامل فواصل باز است. در چنین سری‌هایی، مقدار فاصله گروه اول به طور متعارف برابر با مقدار فاصله گروه بعدی و مقدار فاصله در نظر گرفته می‌شود. آخرین گروهبرابر با فاصله قبلی است.

مقدار بازه گروه دوم 200 است، بنابراین مقدار گروه اول نیز 200 است، مقدار فاصله گروه ماقبل آخر 200 است، یعنی آخرین بازه نیز مقداری برابر با 200 خواهد داشت.

1) محدوده تغییرات را به عنوان تفاوت بین بزرگترین و کوچکترین مقدار مشخصه تعریف کنید:

دامنه تغییرات در اندازه مشارکت 1000 روبل است.

2) اندازه متوسط ​​سهم با فرمول میانگین موزون حسابی تعیین می شود.

بیایید ابتدا تعریف کنیم کمیت گسستهویژگی در هر بازه برای این کار با استفاده از فرمول میانگین حسابی ساده، نقاط میانی بازه ها را پیدا می کنیم.

مقدار متوسط ​​اولین بازه برابر با:

دوم - 500 و غیره

بیایید نتایج محاسبات را در جدول قرار دهیم:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
جمع 400 - 312000

میانگین سپرده در Sberbank شهر 780 روبل خواهد بود:

3) میانگین انحراف خطی میانگین حسابی است انحرافات مطلقمقادیر فردی ویژگی از میانگین کل:

روش محاسبه میانگین انحراف خطی در سری توزیع بازه ای به شرح زیر است:

1. همانطور که در بند 2 نشان داده شده است، میانگین موزون حسابی محاسبه می شود.

2. انحراف مطلق متغیر از میانگین تعیین می شود:

3. انحرافات به دست آمده در فرکانس ضرب می شوند:

4. مجموع انحرافات وزنی بدون در نظر گرفتن علامت پیدا می شود:

5. مجموع انحرافات وزنی بر مجموع فرکانس ها تقسیم می شود:

استفاده از جدول داده های محاسبه شده راحت است:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
جمع 400 - - - 81280

میانگین انحراف خطی اندازه سپرده مشتریان Sberbank 203.2 روبل است.

4) پراکندگی میانگین حسابی مجذور انحرافات هر مقدار مشخصه از میانگین حسابی است.

محاسبه واریانس در سری توزیع بازه ای طبق فرمول انجام می شود:

روش محاسبه واریانس در این مورد به شرح زیر است:

1. همانطور که در بند 2 نشان داده شده است، میانگین موزون حسابی را تعیین کنید.

2. انحراف از میانگین را بیابید:

3. مربع کردن انحراف هر گزینه از میانگین:

4. ضرب انحرافات مجذور در وزن (فرکانس):

5. آثار دریافتی را خلاصه کنید:

6. مقدار حاصل بر مجموع وزن ها (فرکانس ها) تقسیم می شود:

بیایید محاسبات را در یک جدول قرار دهیم:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
جمع 400 - - - 23040000

.

برعکس، اگر یک a.e غیر منفی است. تابعی به گونه ای که ، سپس یک اندازه گیری احتمال کاملاً پیوسته بر روی آن وجود دارد که چگالی آن است.

    تغییر اندازه در انتگرال Lebesgue:

,

هر تابع بورل با توجه به اندازه‌گیری احتمال ادغام‌پذیر است.

پراکندگی، انواع و خواص پراکندگی مفهوم پراکندگی

پراکندگی در آماربه عنوان انحراف معیار مقادیر فردی صفت مجذور میانگین حسابی یافت می شود. بسته به داده های اولیه، با فرمول های واریانس ساده و وزنی تعیین می شود:

1. واریانس ساده(برای داده های گروه بندی نشده) با فرمول محاسبه می شود:

2. واریانس وزنی (برای یک سری تغییرات):

جایی که n - فرکانس (ضریب تکرارپذیری X)

نمونه ای از یافتن واریانس

این صفحه یک مثال استاندارد از یافتن واریانس را توضیح می‌دهد، همچنین می‌توانید به کارهای دیگر برای یافتن آن نگاه کنید

مثال 1. تعیین گروه، میانگین گروه، بین گروه و واریانس کل

مثال 2. یافتن واریانس و ضریب تغییرات در جدول گروه بندی

مثال 3. یافتن واریانس در سری گسسته

مثال 4. ما داده های زیر را برای یک گروه 20 دانشجوی مکاتبه ای داریم. ساخت یک سری بازه ای از توزیع ویژگی، محاسبه مقدار میانگین ویژگی و مطالعه واریانس آن ضروری است.

بیایید یک گروه بندی فاصله ای بسازیم. بیایید محدوده بازه را با فرمول تعیین کنیم:

که در آن X max حداکثر مقدار ویژگی گروه بندی است. Xmin حداقل مقدار ویژگی گروه بندی است. n تعداد فواصل است:

ما n=5 را می پذیریم. مرحله این است: h \u003d (192 - 159) / 5 \u003d 6.6

بیایید یک گروه بندی فاصله ای ایجاد کنیم

برای محاسبات بیشتر، یک جدول کمکی می سازیم:

X "i - وسط فاصله. (به عنوان مثال، وسط فاصله 159 - 165.6 \u003d 162.3)

میانگین رشد دانش آموزان با فرمول میانگین موزون حسابی تعیین می شود:

پراکندگی را با فرمول تعیین می کنیم:

فرمول را می توان به صورت زیر تبدیل کرد:

از این فرمول نتیجه می شود که واریانس است تفاوت بین میانگین مربع های گزینه ها و مربع و میانگین.

واریانس در سری تغییراتبا فواصل مساوی با توجه به روش گشتاورها را می توان با استفاده از خاصیت پراکندگی دوم (تقسیم همه گزینه ها بر مقدار بازه) به روش زیر محاسبه کرد. تعریف واریانسمحاسبه شده به روش ممان، طبق فرمول زیر زمان کمتری دارد:

جایی که i مقدار بازه است. الف - صفر شرطی، که استفاده از وسط بازه با بالاترین فرکانس راحت است. m1 مربع ممان مرتبه اول است. m2 - لحظه سفارش دوم

واریانس ویژگی (اگر در جامعه آماری این ویژگی به گونه ای تغییر کند که فقط دو گزینه متقابل وجود داشته باشد، آنگاه چنین متغیری جایگزین نامیده می شود) را می توان با فرمول محاسبه کرد:

با جایگزینی در این فرمول پراکندگی q = 1- p، به دست می آوریم:

انواع پراکندگی

واریانس کلتغییرات یک صفت را در کل جمعیت تحت تأثیر همه عواملی که باعث این تنوع می شوند اندازه گیری می کند. این برابر است با میانگین مربع انحراف مقادیر فردی ویژگی x از مقدار متوسط ​​کل x و می تواند به عنوان واریانس ساده یا واریانس وزنی تعریف شود.

واریانس درون گروهی تغییرات تصادفی را مشخص می کند، یعنی. بخشی از تغییرات، که به دلیل تأثیر عوامل نامشخص است و به عامل علامت زیربنای گروه بندی بستگی ندارد. این واریانس برابر است با میانگین مجذور انحراف مقادیر فردی صفت در گروه X از میانگین حسابی گروه و می تواند به عنوان یک واریانس ساده یا به عنوان واریانس وزنی محاسبه شود.

به این ترتیب، اندازه گیری های واریانس درون گروهیتنوع یک صفت در یک گروه و با فرمول تعیین می شود:

جایی که xi - میانگین گروه. ni تعداد واحدهای گروه است.

به عنوان مثال، واریانس‌های درون گروهی که باید در کار مطالعه تأثیر صلاحیت‌های کارگران بر سطح بهره‌وری نیروی کار در یک مغازه تعیین شوند، تغییراتی را در تولید در هر گروه نشان می‌دهند که ناشی از همه عوامل ممکن است (وضعیت فنی تجهیزات، در دسترس بودن ابزار و مواد، سن کارگران، شدت کار و...) به جز تفاوت در رده صلاحیت (در گروه، همه کارگران دارای صلاحیت یکسان هستند).

میانگین از داخل واریانس های گروهیمنعکس کننده تغییرات تصادفی است، یعنی بخشی از تغییرات که تحت تأثیر همه عوامل دیگر به استثنای عامل گروه بندی رخ داده است. با فرمول محاسبه می شود:

واریانس بین گروهیتنوع سیستماتیک صفت حاصل را مشخص می کند که به دلیل تأثیر عامل صفت زیربنایی گروه بندی است. برابر است با مجذور میانگین انحراف میانگین های گروه از میانگین کلی. واریانس بین گروهی با فرمول محاسبه می شود:

محدوده تغییرات (یا محدوده تغییرات) -تفاوت بین حداکثر و حداقل مقدار ویژگی است:

در مثال ما، دامنه تغییرات در بازده شیفتی کارگران عبارت است از: در تیپ اول R=105-95=10 کودک، در تیپ دوم R=125-75=50 کودک. (5 برابر بیشتر). این نشان می دهد که خروجی تیپ 1 "پایدارتر" است، اما تیپ دوم ذخایر بیشتری برای رشد تولید دارد، زیرا. اگر همه کارگران به حداکثر خروجی برای این تیپ برسند، می تواند 3 * 125 = 375 قطعه تولید کند و در تیپ 1 فقط 105 * 3 = 315 قطعه تولید کند.
اگر مقادیر افراطی مشخصه برای جمعیت معمولی نباشد، از محدوده چارک یا دهک استفاده می شود. محدوده چارک RQ= Q3-Q1 50 درصد از جمعیت را پوشش می دهد، محدوده دهک اول RD1 = D9-D1 80 درصد داده ها را پوشش می دهد، محدوده دهک دوم RD2 = D8-D2 60 درصد را پوشش می دهد.
مضرات اندیکاتور محدوده تنوعاست، اما مقدار آن منعکس کننده تمام نوسانات صفت نیست.
ساده ترین شاخص تعمیم دهنده که تمام نوسانات یک صفت را منعکس می کند، این است میانگین انحراف خطی، که میانگین حسابی انحراف مطلق گزینه های جداگانه از مقدار میانگین آنها است:

,
برای داده های گروه بندی شده
,
که در آن хi مقدار مشخصه در یک سری گسسته یا وسط بازه در توزیع بازه ای است.
در فرمول های فوق، تفاوت های صورت گرفته به صورت مدول در نظر گرفته می شود، در غیر این صورت، با توجه به خاصیت میانگین حسابی، صورتگر همیشه برابر با صفر خواهد بود. بنابراین، میانگین انحراف خطی در عمل آماری به ندرت استفاده می شود، تنها در مواردی که جمع بندی شاخص ها بدون در نظر گرفتن علامت دارای حس اقتصادی. با کمک آن، به عنوان مثال، ترکیب کارکنان، سودآوری تولید و گردش مالی تجارت خارجی تجزیه و تحلیل می شود.
واریانس ویژگیمجذور میانگین انحرافات متغیر از مقدار میانگین آنها است:
واریانس ساده
,
واریانس وزنی
.
فرمول محاسبه واریانس را می توان ساده کرد:

بنابراین، واریانس برابر است با تفاوت بین میانگین مربعات متغیر و مربع میانگین متغیر جامعه:
.
با این حال، به دلیل مجموع انحرافات مجذور، واریانس یک ایده تحریف شده از انحرافات به دست می دهد، بنابراین میانگین از آن محاسبه می شود. انحراف معیار، که نشان می دهد انواع خاص ویژگی به طور متوسط ​​چقدر از مقدار میانگین خود انحراف دارند. با گرفتن جذر واریانس محاسبه می شود:
برای داده های گروه بندی نشده
,
برای سری تغییرات

چگونه ارزش کمترپراکندگی و انحراف معیار، هر چه جمعیت همگن تر باشد، قابل اعتمادتر (معمولی) خواهد بود مقدار متوسط.
میانگین انحراف خطی و میانگین مربع اعداد نامگذاری شده اند، یعنی در واحدهای اندازه گیری مشخصه بیان می شوند، از نظر محتوا یکسان و از نظر مقدار نزدیک هستند.
شمردن شاخص های مطلقتغییرات با استفاده از جداول توصیه می شود.
جدول 3 - محاسبه ویژگی های تغییرات (به عنوان مثال از دوره داده های خروجی شیفت تیم های کاری)


تعداد کارگران

وسط فاصله

مقادیر تخمینی

جمع:

میانگین تولید نوبتی کارگران:

میانگین انحراف خطی:

پراکندگی خروجی:

انحراف استاندارد بازده کارگران منفرد از تولید متوسط:
.

1 محاسبه پراکندگی به روش گشتاورها

محاسبه واریانس با محاسبات دست و پا گیر همراه است (به خصوص اگر مقدار متوسط ​​بیان شود تعداد زیادیبا چندین رقم اعشار). محاسبات را می توان با استفاده از فرمول ساده شده و خواص پراکندگی ساده کرد.
پراکندگی دارای خواص زیر است:

  1. اگر همه مقادیر مشخصه با همان مقدار A کاهش یا افزایش یابد، واریانس از این کاهش نمی یابد:

,

، سپس یا
با استفاده از خصوصیات واریانس و ابتدا با کاهش همه متغیرهای جامعه بر مقدار A و سپس تقسیم بر مقدار بازه h فرمولی برای محاسبه واریانس در سری های متغیر با فواصل مساوی به دست می آوریم. راه لحظه ها:
,
پراکندگی با روش لحظه ها در کجا محاسبه می شود.
h مقدار فاصله سری تغییرات است.
- مقادیر جدید (تبدیل شده)
A یک مقدار ثابت است که به عنوان وسط بازه با بالاترین فرکانس استفاده می شود. یا نوع با بالاترین فرکانس؛
مربع لحظه مرتبه اول است.
لحظه ای از مرتبه دوم است.
بیایید واریانس را با روش ممان ها بر اساس داده های خروجی شیفت تیم کاری محاسبه کنیم.
جدول 4 - محاسبه پراکندگی به روش ممان


گروه کارگران تولید، عدد.

تعداد کارگران

وسط فاصله

مقادیر تخمینی

روش محاسبه:


  1. محاسبه واریانس:

2 محاسبه واریانس یک ویژگی جایگزین

در میان نشانه هایی که توسط آمار مورد مطالعه قرار می گیرد، مواردی وجود دارد که فقط دو معنای متقابل دارند. اینها نشانه های جایگزین هستند. به ترتیب دو مقدار کمی به آنها داده می شود: گزینه های 1 و 0. فراوانی گزینه های 1 که با p نشان داده می شود، نسبت واحدهایی است که این ویژگی را دارند. تفاوت 1-p=q فراوانی گزینه های 0 است.


xi

میانگین حسابی ویژگی جایگزین
، زیرا p+q=1.

واریانس ویژگی
، زیرا 1-p=q
بنابراین، واریانس یک ویژگی جایگزین برابر است با حاصلضرب نسبت واحدهایی که این ویژگی را دارند و نسبت واحدهایی که این ویژگی را ندارند.
اگر مقادیر 1 و 0 به یک اندازه مکرر باشند، یعنی p=q، واریانس به حداکثر pq=0.25 می رسد.
متغیر واریانس در نظرسنجی های نمونه استفاده می شود، به عنوان مثال، کیفیت محصول.

3 پراکندگی بین گروهی. قانون جمع واریانس

پراکندگی، بر خلاف سایر ویژگی های تنوع، یک کمیت افزایشی است. یعنی در مجموع که بر اساس معیار عامل به گروه ها تقسیم می شود ایکس , واریانس حاصل yرا می توان به واریانس درون هر گروه (داخل گروه) و واریانس بین گروه ها (بین گروه) تجزیه کرد. سپس همراه با مطالعه تنوع صفت در کل جمعیت، امکان بررسی تنوع در هر گروه و همچنین بین این گروه ها فراهم می شود.

واریانس کلتنوع یک صفت را اندازه گیری می کند دردر کل جمعیت تحت تأثیر همه عواملی که باعث این تنوع (انحرافات) شده است. برابر است با مجذور میانگین انحرافات مقادیر فردی ویژگی دراز میانگین کلی و می تواند به صورت واریانس ساده یا وزنی محاسبه شود.
واریانس بین گروهیتنوع ویژگی موثر را مشخص می کند در، ناشی از تأثیر عامل علامت است ایکسزیربنای گروه بندی این تغییرات میانگین گروه را مشخص می کند و برابر است با میانگین مربع انحراف میانگین های گروه از میانگین کل:
,
میانگین حسابی گروه i کجاست.
- تعداد واحدهای گروه i (فرکانس گروه i)؛
- عمومی میانگین جمعیت.
واریانس درون گروهیمنعکس کننده تغییرات تصادفی است، به عنوان مثال، آن بخشی از تغییرات که ناشی از تأثیر عوامل نامشخص است و به ویژگی-عامل زیربنایی گروه بندی بستگی ندارد. این تغییرات مقادیر فردی را نسبت به میانگین های گروهی مشخص می کند، برابر است با میانگین مربع انحراف مقادیر فردی صفت. دردر یک گروه از میانگین حسابی این گروه (میانگین گروه) و به عنوان یک واریانس ساده یا وزنی برای هر گروه محاسبه می شود:
یا ,
تعداد واحدهای گروه کجاست
بر اساس واریانس های درون گروهی برای هر گروه، می توان تعیین کرد میانگین کلی واریانس های درون گروهی:
.
رابطه بین سه واریانس نامیده می شود قوانین جمع واریانسکه بر اساس آن واریانس کل برابر است با مجموع واریانس بین گروهی و میانگین واریانس های درون گروهی:

مثال. هنگام مطالعه تأثیر دسته تعرفه (صلاحیت) کارگران بر سطح بهره وری کار آنها، داده های زیر به دست آمد.
جدول 5 - توزیع کارگران بر اساس میانگین تولید ساعتی.



p/p

کارگران دسته 4

کارگران دسته 5

کار کردن
کارگر، عدد،

کار کردن
کارگر، عدد،

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

در این مثال کارگران بر اساس فاکتور به دو گروه تقسیم می شوند ایکس- مدارک تحصیلی که با رتبه آنها مشخص می شود. صفت مؤثر - تولید - هم تحت تأثیر آن (تغییر بین گروهی) و هم به دلیل سایر عوامل تصادفی (تغییر درون گروهی) تغییر می کند. چالش این است که این تغییرات را با استفاده از سه واریانس اندازه گیری کنیم: کل، بین گروهی و درون گروهی. ضریب تعیین تجربی نسبت تغییرات ویژگی حاصل را نشان می دهد درتحت تأثیر یک علامت عامل ایکس. بقیه تغییرات کل درناشی از تغییرات در سایر عوامل است.
در مثال، ضریب تعیین تجربی به صورت زیر است:
یا 66.7٪
به این معنی که 66.7 درصد از تغییرات بهره وری نیروی کار به دلیل تفاوت در صلاحیت ها و 33.3 درصد به دلیل تأثیر سایر عوامل است.
رابطه همبستگی تجربیتنگاتنگی رابطه بین گروه بندی و ویژگی های مؤثر را نشان می دهد. به عنوان جذر ضریب تعیین تجربی محاسبه می شود:

نسبت همبستگی تجربی و همچنین می تواند مقادیری از 0 تا 1 داشته باشد.
اگر اتصال وجود ندارد، = 0. در این حالت = 0، یعنی میانگین های گروه با یکدیگر برابر هستند و هیچ گونه تنوع بین گروهی وجود ندارد. این بدان معنی است که علامت گروه بندی - عامل بر شکل گیری تنوع کلی تأثیر نمی گذارد.
اگر رابطه عملکردی است، =1. در این حالت، واریانس میانگین گروه برابر با واریانس کل () است، یعنی هیچ گونه تنوع درون گروهی وجود ندارد. این بدان معناست که ویژگی گروه‌بندی به طور کامل تغییر ویژگی حاصل را که مورد مطالعه قرار می‌گیرد، تعیین می‌کند.
هر چه ارزش نزدیکتر باشد رابطه همبستگیبه وحدت، نزدیک‌تر، نزدیک‌تر به وابستگی عملکردی رابطه بین ویژگی‌ها.
برای ارزیابی کیفی نزدیکی ارتباط بین نشانه ها، از روابط چادوک استفاده می شود.

در مثال که نشان دهنده رابطه نزدیک بین بهره وری کارگران و شایستگی آنهاست.

با این حال، این ویژگی به تنهایی برای مطالعه کافی نیست متغیر تصادفی. دو تیرانداز را تصور کنید که در حال شلیک به یک هدف هستند. یکی با دقت شلیک می کند و نزدیک به مرکز ضربه می زند و دیگری ... فقط سرگرم می شود و حتی هدف نمی گیرد. اما آنچه خنده دار است این است میانگیننتیجه دقیقاً مشابه تیرانداز اول خواهد بود! این وضعیت به صورت مشروط با متغیرهای تصادفی زیر نشان داده می شود:

انتظار ریاضی "تک تیرانداز" برابر است، با این حال، برای "فرد جالب": - آن نیز صفر است!

بنابراین، نیاز به تعیین کمیت تا کجا وجود دارد پراکنده شده استگلوله ها (مقادیر تصادفی) نسبت به مرکز هدف ( انتظارات ریاضی). خوب و پراکندگیترجمه از لاتین فقط به عنوان پراکندگی .

بیایید ببینیم چگونه این تعریف شده است. مشخصه عددیدر یکی از نمونه های قسمت اول درس:

در آنجا یک انتظار ریاضی ناامیدکننده از این بازی پیدا کردیم و اکنون باید واریانس آن را محاسبه کنیم که نشان داده شده استاز طریق .

بیایید دریابیم که بردها/باختها نسبت به مقدار متوسط ​​چقدر "پراکنده" هستند. بدیهی است که برای این باید محاسبه کنیم تفاوتبین مقادیر یک متغیر تصادفیو او انتظارات ریاضی:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

اکنون به نظر می رسد لازم است نتایج را جمع بندی کنیم، اما این راه خوب نیست - به این دلیل که نوسانات به سمت چپ با نوسانات سمت راست یکدیگر را خنثی می کنند. بنابراین، برای مثال، تیرانداز "آماتور". (مثال بالا)تفاوت ها خواهد بود ، و وقتی اضافه شوند صفر می دهند، بنابراین ما هیچ تخمینی از پراکندگی تیراندازی او نخواهیم گرفت.

برای دور زدن این ناراحتی، در نظر بگیرید ماژول هاتفاوت‌ها، اما به دلایل فنی، این رویکرد زمانی ریشه دوانده است که آنها مربع شوند. راحت تر است که راه حل را در یک جدول مرتب کنید:

و در اینجا التماس برای محاسبه است میانگین وزنیمقدار انحرافات مجذور چیست؟ مال آن هاست ارزش مورد انتظار، که معیار پراکندگی است:

تعریفپراکندگی بلافاصله از تعریف مشخص می شود که واریانس نمی تواند منفی باشد- برای تمرین توجه داشته باشید!

بیایید به یاد بیاوریم که چگونه انتظارات را پیدا کنیم. مجذور اختلافات را در احتمالات مربوطه ضرب کنید (ادامه جدول):
- به بیان مجازی، این "نیروی کشش" است،
و نتایج را خلاصه کنید:

آیا فکر نمی کنید که در پس زمینه بردها، نتیجه خیلی بزرگ بود؟ درست است - ما در حال مربع کردن بودیم و برای بازگشت به بعد بازی خود باید استخراج کنیم ریشه دوم. این مقدار نامیده می شود انحراف معیار و نشان داد نامه یونانی"سیگما":

گاهی به این معنا گفته می شود انحراف معیار .

معنی آن چیست؟ اگر با انحراف معیار از انتظار ریاضی به چپ و راست منحرف شویم:

- سپس محتمل ترین مقادیر متغیر تصادفی روی این بازه متمرکز می شود. آنچه ما در واقع می بینیم:

با این حال، این اتفاق افتاد که در تجزیه و تحلیل پراکندگی تقریباً همیشه با مفهوم پراکندگی عمل می شود. بیایید ببینیم در رابطه با بازی ها چه معنایی دارد. اگر در مورد تیراندازان ما در مورد "دقت" ضربه ها نسبت به مرکز هدف صحبت می کنیم، در اینجا پراکندگی دو چیز را مشخص می کند:

اولاً بدیهی است که با افزایش نرخ ها، واریانس نیز افزایش می یابد. بنابراین، برای مثال، اگر 10 برابر افزایش دهیم، انتظار ریاضی 10 برابر و واریانس 100 برابر افزایش می یابد. (به محض اینکه یک مقدار درجه دوم باشد). اما توجه داشته باشید که قوانین بازی تغییر نکرده است! فقط نرخ ها تغییر کرده اند، به طور کلی، ما قبلاً 10 روبل شرط می کردیم، اکنون 100.

دومین نکته جالب تر این است که واریانس سبک بازی را مشخص می کند. به صورت ذهنی نرخ بازی را اصلاح کنید در یک سطح معینو ببینید اینجا چیست:

یک بازی با واریانس کم یک بازی محتاطانه است. بازیکن تمایل دارد که قابل اعتمادترین طرح ها را انتخاب کند، جایی که در یک زمان زیاد از دست نمی دهد/برنده می شود. به عنوان مثال، سیستم قرمز/مشکی در رولت (به مثال 4 مقاله مراجعه کنید متغیرهای تصادفی) .

بازی با واریانس بالا او اغلب نامیده می شود پراکندگیبازی این یک سبک بازی ماجراجویانه یا تهاجمی است که در آن بازیکن طرح های "آدرنالین" را انتخاب می کند. حداقل یادمون باشه "مارتینگل"، که در آن مبالغ مورد نظر مرتبه‌ای بزرگتر از بازی «آرام» پاراگراف قبلی است.

وضعیت در پوکر نشان دهنده است: به اصطلاح وجود دارد تنگبازیکنانی که تمایل دارند محتاط باشند و با سرمایه بازی خود "لرزند". (بانک). جای تعجب نیست که سرمایه آنها نوسان زیادی ندارد (واریانس کم). برعکس، اگر بازیکنی واریانس بالایی داشته باشد، مهاجم است. او اغلب ریسک می کند، شرط بندی های بزرگ می کند و هم می تواند یک بانک بزرگ را بشکند و هم تکه تکه شود.

همین اتفاق در فارکس و غیره رخ می دهد - نمونه های زیادی وجود دارد.

علاوه بر این، در همه موارد مهم نیست که بازی برای یک پنی باشد یا برای هزاران دلار. هر سطح دارای بازیکنان واریانس کم و زیاد خود است. خوب، برای برد متوسط، همانطور که به یاد داریم، "مسئول" ارزش مورد انتظار.

احتمالاً متوجه شده اید که یافتن واریانس یک فرآیند طولانی و پر زحمت است. اما ریاضیات سخاوتمندانه است:

فرمول برای یافتن واریانس

این فرمول مستقیماً از تعریف واریانس گرفته شده است و ما بلافاصله آن را در گردش قرار می دهیم. من پلاک را با بازی خودمان از بالا کپی می کنم:

و انتظار پیدا شده .

واریانس را به روش دوم محاسبه می کنیم. ابتدا، بیایید انتظار ریاضی را پیدا کنیم - مربع متغیر تصادفی. توسط تعریف انتظارات ریاضی:

در این مورد:

بنابراین، طبق فرمول:

همانطور که می گویند، تفاوت را احساس کنید. و البته در عمل بهتر است از فرمول استفاده شود (مگر اینکه شرط اقتضا کند).

ما بر تکنیک حل و طراحی مسلط هستیم:

مثال 6

انتظارات ریاضی، واریانس و انحراف معیار آن را بیابید.

این وظیفه در همه جا یافت می شود، و به عنوان یک قاعده، بدون معنای معنی دار است.
شما می توانید چندین لامپ با اعداد را تصور کنید که در یک دیوانه با احتمالات خاص روشن می شوند :)

راه حل: خلاصه کردن محاسبات اصلی در یک جدول راحت است. ابتدا داده های اولیه را در دو خط بالا می نویسیم. سپس محصولات را محاسبه می کنیم، سپس و در نهایت مجموع ستون سمت راست را محاسبه می کنیم:

در واقع، تقریبا همه چیز آماده است. در خط سوم، یک انتظار ریاضی آماده ترسیم شد: .

پراکندگی با فرمول محاسبه می شود:

و در نهایت انحراف معیار:
- شخصاً من معمولاً 2 رقم اعشار گرد می کنم.

تمام محاسبات را می توان در یک ماشین حساب و حتی بهتر از آن - در اکسل انجام داد:

اینجا اشتباه کردن سخته :)

پاسخ:

آنهایی که آرزو دارند می توانند زندگی خود را بیشتر ساده کنند و از من استفاده کنند ماشین حساب (نسخه ی نمایشی)، که نه تنها به صورت آنی این مشکل را حل می کند، بلکه می سازد گرافیک موضوعی (زود بیا). برنامه می تواند دانلود در کتابخانه- اگر حداقل یکی را دانلود کرده اید مطالب آموزشییا دریافت کنید یک راه دیگر. با تشکر برای حمایت از پروژه!

چند کار برای راه حل مستقل:

مثال 7

واریانس متغیر تصادفی مثال قبلی را بر اساس تعریف محاسبه کنید.

و یک مثال مشابه:

مثال 8

یک متغیر تصادفی گسسته توسط قانون توزیع خودش داده می شود:

بله، مقادیر متغیر تصادفی می تواند بسیار بزرگ باشد (نمونه ای از کار واقعی)و در اینجا در صورت امکان از Excel استفاده کنید. همانطور که، به هر حال، در مثال 7 - سریعتر، قابل اعتمادتر و دلپذیرتر است.

راه حل ها و پاسخ ها در پایین صفحه.

در پایان بخش دوم درس، ما یک کار معمولی دیگر را تجزیه و تحلیل خواهیم کرد، حتی می توان گفت یک ریبوس کوچک:

مثال 9

یک متغیر تصادفی گسسته می تواند تنها دو مقدار بگیرد: و، و. احتمال، انتظارات ریاضی و واریانس مشخص است.

راه حل: بیایید با یک احتمال مجهول شروع کنیم. از آنجایی که یک متغیر تصادفی می تواند تنها دو مقدار بگیرد، پس مجموع احتمالات رویدادهای مربوطه:

و از آن پس .

باقی می ماند برای پیدا کردن ...، گفتن آسان :) اما اوه خوب، شروع شد. با تعریف انتظارات ریاضی:
- مقادیر شناخته شده را جایگزین کنید:

- و هیچ چیز دیگری نمی توان از این معادله خارج کرد، به جز اینکه می توانید آن را در جهت معمول بازنویسی کنید:

یا:

در مورد اقدامات بعدی، فکر می کنم می توانید حدس بزنید. بیایید سیستم را ایجاد و حل کنیم:

اعداد اعشاری- البته این مایه شرمساری کامل است. هر دو معادله را در 10 ضرب کنید:

و تقسیم بر 2:

این خیلی بهتر است. از معادله 1 بیان می کنیم:
(این راه ساده تر است)- جایگزین در معادله 2:


ما در حال ساختن هستیم مربعو ساده سازی ها را انجام دهید:

ضرب می کنیم در:

در نتیجه، معادله درجه دوم، متمایز آن را پیدا کنید:
- کامل!

و ما دو راه حل دریافت می کنیم:

1) اگر ، سپس ;

2) اگر ، سپس .

اولین جفت مقادیر شرط را برآورده می کند. با احتمال زیاد، همه چیز درست است، اما، با این وجود، قانون توزیع را می نویسیم:

و یک بررسی انجام دهید، یعنی انتظار را پیدا کنید:

نظریه احتمال شاخه خاصی از ریاضیات است که فقط توسط دانشجویان مؤسسات آموزش عالی مطالعه می شود. آیا عاشق محاسبات و فرمول ها هستید؟ آیا از چشم انداز آشنایی با توزیع نرمال، آنتروپی مجموعه، انتظارات ریاضی و واریانس یک متغیر تصادفی گسسته نمی ترسید؟ سپس این موضوع برای شما بسیار جالب خواهد بود. بیایید با برخی از مهمترین مفاهیم اساسی این بخش از علم آشنا شویم.

بیایید اصول را به خاطر بسپاریم

حتی اگر ساده ترین مفاهیم نظریه احتمال را به خاطر دارید، از پاراگراف های اول مقاله غافل نشوید. واقعیت این است که بدون درک روشنی از اصول اولیه، نمی توانید با فرمول های مورد بحث در زیر کار کنید.

بنابراین، یک رویداد تصادفی، یک آزمایش وجود دارد. در نتیجه اقدامات انجام شده، می توانیم چندین نتیجه را به دست آوریم - برخی از آنها رایج تر هستند، برخی دیگر کمتر رایج هستند. احتمال یک رویداد، نسبت تعداد پیامدهای واقعی دریافت شده از یک نوع است به تعداد کلممکن است. فقط دانستن تعریف کلاسیکاز این مفهوم، می توانید شروع به مطالعه انتظارات ریاضی و واریانس متغیرهای تصادفی پیوسته کنید.

میانگین

در مدرسه، در درس ریاضیات، کار را با میانگین حسابی شروع کردید. این مفهوم به طور گسترده در نظریه احتمال استفاده می شود و بنابراین نمی توان آن را نادیده گرفت. نکته اصلی برای ما در حال حاضر این است که در فرمول های انتظار ریاضی و واریانس یک متغیر تصادفی با آن مواجه خواهیم شد.

ما دنباله ای از اعداد داریم و می خواهیم میانگین حسابی را پیدا کنیم. تنها چیزی که از ما خواسته می شود این است که همه چیزهای موجود را جمع کنیم و بر تعداد عناصر در دنباله تقسیم کنیم. بگذارید اعداد از 1 تا 9 را داشته باشیم. مجموع عناصر 45 می شود و این مقدار را بر 9 تقسیم می کنیم. پاسخ: - 5.

پراکندگی

در اصطلاح علمی، واریانس میانگین مجذور انحراف مقادیر مشخصه به دست آمده از میانگین حسابی است. یکی با حرف بزرگ لاتین D نشان داده می شود. برای محاسبه آن چه چیزی لازم است؟ برای هر عنصر دنباله، تفاوت بین عدد موجود و میانگین حسابی را محاسبه کرده و آن را مجذور می کنیم. برای رویدادی که در نظر داریم دقیقاً به همان اندازه ارزش وجود خواهد داشت. بعد، همه چیزهای دریافتی را خلاصه می کنیم و بر تعداد عناصر در دنباله تقسیم می کنیم. اگر پنج نتیجه ممکن داریم، تقسیم بر پنج کنیم.

واریانس همچنین دارای ویژگی هایی است که برای اعمال آن هنگام حل مسائل باید به خاطر بسپارید. برای مثال، اگر متغیر تصادفی X برابر افزایش یابد، واریانس X برابر مربع افزایش می‌یابد (یعنی X*X). هرگز کمتر از صفر نیست و به تغییر مقادیر با مقدار مساوی به بالا یا پایین بستگی ندارد. علاوه بر این، برای تست های مستقلواریانس مجموع برابر است با مجموع واریانس ها.

اکنون قطعاً باید نمونه هایی از واریانس یک متغیر تصادفی گسسته و انتظار ریاضی را در نظر بگیریم.

فرض کنید 21 آزمایش انجام دادیم و 7 نتیجه متفاوت گرفتیم. هر کدام را به ترتیب 1،2،2،3،4،4 و 5 بار مشاهده کردیم. واریانس چقدر خواهد بود؟

ابتدا میانگین حسابی را محاسبه می کنیم: مجموع عناصر البته 21 است. آن را بر 7 تقسیم می کنیم و عدد 3 را به دست می آوریم. اکنون از هر عدد در دنباله اصلی 3 کم کرده و هر مقدار را مربع می کنیم و نتایج را با هم جمع می کنیم. . معلوم می شود 12. اکنون باقی مانده است که عدد را بر تعداد عناصر تقسیم کنیم، و به نظر می رسد، این همه است. اما یک گرفتاری وجود دارد! بیایید در مورد آن بحث کنیم.

وابستگی به تعداد آزمایش

معلوم می شود که هنگام محاسبه واریانس، مخرج می تواند یکی از دو عدد باشد: N یا N-1. در اینجا N تعداد آزمایش های انجام شده یا تعداد عناصر در دنباله (که اساساً یکسان است) است. به چه چیزی بستگی دارد؟

اگر تعداد تست‌ها را صدها اندازه‌گیری کنیم، باید N را در مخرج قرار دهیم و اگر بر حسب واحد باشد، N-1. دانشمندان تصمیم گرفتند مرز را کاملاً نمادین ترسیم کنند: امروز در امتداد عدد 30 قرار دارد. اگر کمتر از 30 آزمایش انجام دادیم، مقدار را بر N-1 و اگر بیشتر بود، بر N تقسیم می کنیم.

یک وظیفه

بیایید به مثال خود در مورد حل مشکل واریانس و انتظار برگردیم. گرفتیم عدد میانی 12 که باید بر N یا N-1 تقسیم می شد. از آنجایی که ما 21 آزمایش انجام دادیم که کمتر از 30 آزمایش است، گزینه دوم را انتخاب می کنیم. بنابراین پاسخ این است: واریانس 12/2 = 2 است.

ارزش مورد انتظار

بریم سراغ مفهوم دوم که باید در این مقاله به آن توجه کنیم. انتظارات ریاضی نتیجه جمع کردن تمام نتایج ممکن ضربدر احتمالات مربوطه است. درک این نکته مهم است که مقدار حاصل، و همچنین نتیجه محاسبه واریانس، تنها یک بار برای کل کار به دست می آید، مهم نیست که چند نتیجه را در نظر می گیرد.

فرمول انتظارات ریاضی بسیار ساده است: ما نتیجه را می گیریم، آن را در احتمال آن ضرب می کنیم، همان را برای نتیجه دوم، سوم و غیره اضافه می کنیم. همه چیز مربوط به این مفهوم به راحتی قابل محاسبه است. به عنوان مثال، مجموع انتظارات ریاضی برابر است با انتظارات ریاضی از مجموع. در مورد کار هم همینطور است. هر کمیتی در تئوری احتمال اجازه انجام چنین عملیات ساده ای را نمی دهد. بیایید یک تکلیف بگیریم و ارزش دو مفهومی را که همزمان مطالعه کرده ایم محاسبه کنیم. علاوه بر این، تئوری حواسمان را پرت کرد - وقت آن است که تمرین کنیم.

یک مثال دیگر

ما 50 کارآزمایی انجام دادیم و 10 نوع نتیجه گرفتیم - اعداد 0 تا 9 - که در درصدهای متفاوت ظاهر شدند. اینها به ترتیب عبارتند از: 2٪، 10٪، 4٪، 14٪، 2٪، 18٪، 6٪، 16٪، 10٪، 18٪. به یاد بیاورید که برای بدست آوردن احتمالات، باید مقادیر درصد را بر 100 تقسیم کنید. بنابراین، 0.02 به دست می آید. 0.1 و غیره اجازه دهید مثالی از حل مسئله برای واریانس یک متغیر تصادفی و انتظار ریاضی ارائه دهیم.

ما میانگین حسابی را با استفاده از فرمولی که از دبستان به خاطر داریم محاسبه می کنیم: 50/10 = 5.

حالا بیایید احتمالات را به تعداد پیامدهای "تکه‌ای" ترجمه کنیم تا شمارش راحت‌تر شود. 1، 5، 2، 7، 1، 9، 3، 8، 5 و 9 را به دست می آوریم. از هر مقدار به دست آمده، میانگین حسابی را کم می کنیم و پس از آن هر یک از نتایج به دست آمده را مربع می کنیم. نحوه انجام این کار را با عنصر اول به عنوان مثال ببینید: 1 - 5 = (-4). علاوه بر این: (-4) * (-4) = 16. برای مقادیر دیگر، این عملیات را خودتان انجام دهید. اگر همه چیز را به درستی انجام دادید، پس از اضافه کردن همه چیز، 90 دریافت می کنید.

بیایید محاسبه واریانس و میانگین را با تقسیم 90 بر N ادامه دهیم. چرا N را انتخاب می کنیم و N-1 را انتخاب نمی کنیم؟ درست است، زیرا تعداد آزمایش های انجام شده بیش از 30 است. بنابراین: 90/10 = 9. ما پراکندگی را دریافت کردیم. اگر شماره دیگری دریافت کردید، ناامید نشوید. به احتمال زیاد، شما یک اشتباه پیش پا افتاده در محاسبات انجام داده اید. آنچه را که نوشتید دوباره بررسی کنید، مطمئن باشید همه چیز سر جای خود قرار می گیرد.

در نهایت، فرمول انتظارات ریاضی را یادآوری می کنیم. ما همه محاسبات را نمی دهیم، فقط پاسخی را می نویسیم که می توانید پس از انجام تمام مراحل مورد نیاز بررسی کنید. مقدار مورد انتظار 5.48 خواهد بود. ما فقط نحوه انجام عملیات را با استفاده از مثال عناصر اول به یاد می آوریم: 0 * 0.02 + 1 * 0.1 ... و غیره. همانطور که می بینید، ما به سادگی مقدار نتیجه را در احتمال آن ضرب می کنیم.

انحراف

مفهوم دیگری که ارتباط نزدیکی با پراکندگی و انتظارات ریاضی دارد، انحراف معیار است. یا مشخص شده است با حروف لاتین sd یا «سیگما» با حروف کوچک یونانی. این مفهوم نشان می دهد که چگونه به طور متوسط ​​مقادیر از ویژگی مرکزی منحرف می شوند. برای یافتن مقدار آن، باید جذر واریانس را محاسبه کنید.

اگر نمودار بسازید توزیع نرمالو می خواهید انحراف مربع را مستقیماً روی آن ببینید، این کار را می توان در چند مرحله انجام داد. نیمی از تصویر را به سمت چپ یا راست حالت (مقدار مرکزی) بگیرید، یک عمود بر محور افقی بکشید تا مساحت شکل های حاصل برابر باشد. مقدار قطعه بین وسط توزیع و برآمدگی حاصل روی محور افقی انحراف معیار خواهد بود.

نرم افزار

همانطور که از توضیحات فرمول ها و مثال های ارائه شده مشخص است، محاسبه واریانس و انتظارات ریاضی ساده ترین روش از نظر حسابی نیست. برای اینکه زمان را هدر ندهید، منطقی است که از برنامه استفاده شده در بالاتر استفاده کنید موسسات آموزشی- به آن "R" می گویند. دارای توابعی است که به شما امکان می دهد مقادیر بسیاری از مفاهیم را از آمار و تئوری احتمال محاسبه کنید.

به عنوان مثال، شما یک بردار از مقادیر را تعریف می کنید. این کار به صورت زیر انجام می شود: برداری<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

سرانجام

پراکندگی و انتظارات ریاضی بدون آنها محاسبه هر چیزی در آینده دشوار است. در دوره اصلی سخنرانی در دانشگاه ها، آنها در ماه های اول مطالعه موضوع مورد توجه قرار می گیرند. دقیقاً به دلیل عدم درک این مفاهیم ساده و ناتوانی در محاسبه آنها است که بسیاری از دانش آموزان بلافاصله شروع به عقب افتادن از برنامه می کنند و بعداً در پایان جلسه نمرات ضعیفی دریافت می کنند که آنها را از بورسیه محروم می کند.

حداقل یک هفته به مدت نیم ساعت در روز تمرین کنید و کارهایی مشابه آنچه در این مقاله ارائه شده است را حل کنید. سپس، در هر آزمون تئوری احتمال، با مثال هایی بدون نکات اضافی و برگه های تقلب مقابله خواهید کرد.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...